Importance: Social determinants of health (SDOH) are known to be associated with increased risk of suicidal behaviors, but few studies utilized SDOH from unstructured electronic health record (EHR) notes. Objective: To investigate associations between suicide and recent SDOH, identified using structured and unstructured data. Design: Nested case-control study. Setting: EHR data from the US Veterans Health Administration (VHA). Participants: 6,122,785 Veterans who received care in the US VHA between October 1, 2010, and September 30, 2015. Exposures: Occurrence of SDOH over a maximum span of two years compared with no occurrence of SDOH. Main Outcomes and Measures: Cases of suicide deaths were matched with 4 controls on birth year, cohort entry date, sex, and duration of follow-up. We developed an NLP system to extract SDOH from unstructured notes. Structured data, NLP on unstructured data, and combining them yielded seven, eight and nine SDOH respectively. Adjusted odds ratios (aORs) and 95% confidence intervals (CIs) were estimated using conditional logistic regression. Results: In our cohort, 8,821 Veterans committed suicide during 23,725,382 person-years of follow-up (incidence rate 37.18 /100,000 person-years). Our cohort was mostly male (92.23%) and white (76.99%). Across the six common SDOH as covariates, NLP-extracted SDOH, on average, covered 84.38% of all SDOH occurrences. All SDOH, measured by structured data and NLP, were significantly associated with increased risk of suicide. The SDOH with the largest effects was legal problems (aOR=2.67, 95% CI=2.46-2.89), followed by violence (aOR=2.26, 95% CI=2.11-2.43). NLP-extracted and structured SDOH were also associated with suicide. Conclusions and Relevance: NLP-extracted SDOH were always significantly associated with increased risk of suicide among Veterans, suggesting the potential of NLP in public health studies.
translated by 谷歌翻译
Nostradamus, inspired by the French astrologer and reputed seer, is a detailed study exploring relations between environmental factors and changes in the stock market. In this paper, we analyze associative correlation and causation between environmental elements and stock prices based on the US financial market, global climate trends, and daily weather records to demonstrate significant relationships between climate and stock price fluctuation. Our analysis covers short and long-term rises and dips in company stock performances. Lastly, we take four natural disasters as a case study to observe their effect on the emotional state of people and their influence on the stock market.
translated by 谷歌翻译
当今现实生活系统中图的普遍性很明显,该系统要么明确地以图形为单位,要么可以很容易地将其建模为一个。因此,这种图形结构是商店丰富的信息。这具有各种含义,具体取决于我们对节点还是整个图表感兴趣。在本文中,我们主要关注的是稍后的,即图表的结构会影响其代表的现实生活系统的属性。这种结构影响的模型将有助于通过其结构特性来推断复杂和大型系统(例如VLSI电路)的有用特性。但是,在我们可以将基于机器学习(ML)技术应用于建模这种关系之前,必须有效地表示图。在本文中,我们提出了一个图表表示,该图表是无损的,在顶点数量方面是线性大小的,并给出图形的1-D表示。我们的表示是基于对树木编码的Prufer编码。此外,我们的方法基于一种新颖的技术,称为$ \ Mathcal {gt} $ - 增强功能,我们首先转换图形,使其可以由单数树表示。编码还提供了包括附加图形属性并改善代码的解释性的范围。
translated by 谷歌翻译
来自给定时间序列数据的相关矩阵的预测有多种针对一系列问题的应用程序,例如从峰值数据推断神经元连接,从表达数据中推论基因之间的因果关系,并发现气候变化的长空间范围影响。预测相关矩阵的传统方法利用了基础网络所有节点的时间序列数据。在这里,我们使用监督的机器学习技术来预测一些随机选择节点的有限时间序列信息的整个系统的相关矩阵。来自模型的预测的准确性证实,整个系统的一个子集的有限时间序列足以做出良好的相关矩阵预测。此外,使用无监督的学习算法,我们提供了对模型预测成功的见解。最后,我们将此处开发的机器学习模型应用于现实世界数据集。
translated by 谷歌翻译
最近,已经提出了表面电灰度(EMG)作为一种新的生物特征,用于解决当前生物识别性的一些关键限制,例如欺骗和活力。 EMG信号具有独特的特征:它们对个体(生物读像学)固有不同,并且可以定制以实现多长度代码或密码(例如,通过执行不同的手势)。但是,基于目前的基于EMG的生物识别研究具有两个关键限制:1)与其他更熟悉的生物识别性状相比,2)限于单一会话或单日数据集。在本研究中,从43种参与者收集前臂和手腕EMG数据,在三个不同的日子中收集,而在长时间的分离,同时进行静电手势和手势手势。多日生物识别认证导致前臂设置为0.017的中值,手腕设置为0.025,可与建立良好的生物识别性状相当,表明在多天内表现一致的性能。呈现的大型多日数据集和调查结果可以促进基于EMG的生物识别和其他基于手势识别的应用的进一步研究。
translated by 谷歌翻译
在文献中提出了各种各样的公平度量和可解释的人工智能(XAI)方法,以确定在关键现实环境中使用的机器学习模型中的偏差。但是,仅报告模型的偏差,或使用现有XAI技术生成解释不足以定位并最终减轻偏差源。在这项工作中,我们通过识别对这种行为的根本原因的训练数据的连贯子集来引入Gopher,该系统产生紧凑,可解释和意外模型行为的偏差或意外模型行为。具体而言,我们介绍了因果责任的概念,这些责任通过删除或更新其数据集来解决培训数据的程度可以解决偏差。建立在这一概念上,我们开发了一种有效的方法,用于生成解释模型偏差的顶级模式,该模型偏置利用来自ML社区的技术来实现因果责任,并使用修剪规则来管理模式的大搜索空间。我们的实验评估表明了Gopher在为识别和调试偏置来源产生可解释解释时的有效性。
translated by 谷歌翻译
分享自治是指使自治工人能够与人类合作的方法,以提高人类性能。然而,除了提高性能之外,它通常也可能是有益的,代理同时考虑保留用户的经验或合作满意度。为了解决这一额外目标,我们通过约束自主代理的干预次数来研究改进用户体验的方法。我们提出了两种无模型的加强学习方法,可以考虑到干预措施的艰难和软限制。我们表明,我们的方法不仅表现出现有的基线,而且还消除了手动调整黑匣子超参数,以控制援助水平。我们还提供了对干预情景的深入分析,以进一步照亮系统理解。
translated by 谷歌翻译
我们提出了一种新颖的三阶段查找解析标签工作流程,用于众包注释,以减少任务指令中的模糊性,从而提高注释质量。第1阶段(查找)询问人群找到其正确标签似乎暧昧的任务指令的示例。还要求工人提供一个简短的标签,它描述了所发现的特定实例体现的模糊概念。我们比较这个阶段的合作与非协作设计。在第2阶段(解析)中,请求者选择一个或多个这些模糊的例子到标签(解析歧义)。新标签将自动注入任务说明,以提高清晰度。最后,在第3阶段(标签)中,工人使用经修订的指南进行实际注释,澄清示例。我们比较三个使用这些示例的设计:仅限示例,仅标记或两者。我们通过亚马逊机械土耳其报告六个任务设计中的图像标记实验。结果显示了有关众包注释任务的有效设计的提高的注释准确性和进一步的见解。
translated by 谷歌翻译
异常检测和定位是具有多种应用的重要视觉问题。各种不同表面上异常区域的有效和通用的语义分割,在各种不同的表面上,大多数异常区域没有任何明显的模式,仍处于积极研究。在广大基础设施中检测是一种重要的基础设施的定期健康监测和故障(异常)是一种重要的安全相关任务,是基于视觉的异常分割的一个这样的应用领域。然而,由于表面故障的大变化,纹理的结构材料/背景,照明条件等,任务是非常具有挑战性的。裂缝是临界和频繁的表面缺陷,表现为极端曲折形状的薄,细长区域。它们是在深入学习的最难检测的故障之一中。在这项工作中,我们解决了自动裂缝分割问题的一个开放方面,通过模拟问题来概括和提高各种场景的分割性能。我们仔细研究和抽象涉及的子问题,并在更广泛的背景下解决它们,使我们的解决方案通用。在各种与不同基础设施监视相关的数据集上,在不同的条件下,我们的模型在没有任何铃声和口哨的情况下始终如一地优于最先进的算法。这种性能优势在我们模型的两个部署中轻松携带,针对行业提供的数据集进行测试。更进一步的是,我们也可以为两个制造质量检查场景建立我们的模型的表现,其中缺陷类型不仅仅是裂缝等价物,而且更加不同。因此,我们希望我们的模型确实是一个真正的通用缺陷分段模型。
translated by 谷歌翻译
Pyro is a probabilistic programming language built on Python as a platform for developing advanced probabilistic models in AI research. To scale to large datasets and high-dimensional models, Pyro uses stochastic variational inference algorithms and probability distributions built on top of PyTorch, a modern GPU-accelerated deep learning framework. To accommodate complex or model-specific algorithmic behavior, Pyro leverages Poutine, a library of composable building blocks for modifying the behavior of probabilistic programs.
translated by 谷歌翻译